DiscoverAI HOUSE PodcastЯк створюють українську LLM Lapa: 80 мільярдів токенів, бенчмарки й токенізація | AI HOUSE Podcast
Як створюють українську LLM Lapa: 80 мільярдів токенів, бенчмарки й токенізація | AI HOUSE Podcast

Як створюють українську LLM Lapa: 80 мільярдів токенів, бенчмарки й токенізація | AI HOUSE Podcast

Update: 2025-11-07
Share

Description

У цьому випуску говоримо про Lapa — першу українську reasoning LLM. Разом із Юрієм Панівим розбираємо, як народилася ідея створити модель, що мислить українською: від збору даних і побудови токенізатора — до тренування reasoning-здатності та очищення корпусу від пропаганди.


Також обговорюємо, як команда перевіряє, чи модель «розуміє» різні домени, що далі з мультимодальністю та як планують дистрибуцію Lapa.


📬 Посилання на благодійну організацію «Реактивна пошта»: https://reactivepost.org/


Спікери:

Гість — Юрій Панів Data Scientist у Nortal, аспірант УКУ | https://www.linkedin.com/in/yurii-paniv-aa969b151/?originalSubdomain=ua

Ведучий — Роман Кислий, Research Data Scientist | https://www.linkedin.com/in/romankyslyi/?originalSubdomain=ua


Якщо хочете підтримати наш проєкт, стати партнером та записати спільний епізод — пишіть нам на пошту hi@aihouse.org.ua


Корисні посилання: — Модель: https://huggingface.co/spaces/lapa-llm/lapa — Код: https://github.com/lapa-llm/lapa-llm


Про AI HOUSEAI HOUSE — це найбільше АІ-комʼюніті в Україні. Ми обмінюємося досвідом і знаннями, здобуваємо навички, реалізовуємо нові технологічні та бізнесові ідеї, розвиваємо індустрію ШІ та сприяємо народженню продуктових AI-стартапів вдома, в Україні.


Долучайтеся до нашого комʼюніті:

Facebook: https://www.facebook.com/AIHouse.Ukraine

Instagram: https://www.instagram.com/aihouse.ukraine/

Twitter: https://twitter.com/AIHouse_Ukraine

Telegram-чат для спілкування: https://t.me/aihousechat

Телеграм-канал: https://t.me/AIHOUSE

Comments 
In Channel
loading
00:00
00:00
x

0.5x

0.8x

1.0x

1.25x

1.5x

2.0x

3.0x

Sleep Timer

Off

End of Episode

5 Minutes

10 Minutes

15 Minutes

30 Minutes

45 Minutes

60 Minutes

120 Minutes

Як створюють українську LLM Lapa: 80 мільярдів токенів, бенчмарки й токенізація | AI HOUSE Podcast

Як створюють українську LLM Lapa: 80 мільярдів токенів, бенчмарки й токенізація | AI HOUSE Podcast

AI HOUSE